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摘 要 


在 日 常生 活 中 ,从 “第 三 人 称 ” 的 视角 识别 并 理解 他 人 的 社会 互动 至 关 重 要 。 这 种 社会 互动 加 工具 有 


两 种 认 知 特性 : 构 形 整体 性 和 动作 关联 性 ; 体现 为 一 个 由 众多 脑 区 共同 参与 的 层级 加 工 过 程 ， 主 要 包括 个 体 知 
觉 网 络 、 动 作 观 察 网 络 和 心智 化 网 络 。 其 中 ,后 里 上 沟 等 脑 区 在 表征 社会 互动 关系 中 起 着 关键 作用 。 未 来 的 
研究 需要 结合 多 种 技术 手段 进一步 揭示 社会 互动 加 工 的 遗传 特性 和 神经 机 制 ， 并 关注 它 在 实际 生活 中 的 应 用 。 
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1 引言 


社会 互动 (social interaction) 是 指 个 体 通过 动 
作 或 语言 表达 某 种 交流 的 意图 ， 而 对 方 理解 这 种 
意图 并 做 出 恰当 的 回应 从 而 达成 有 意义 的 社会 
交流 过 程 (Capozzi & Ristic, 2018; Hauser & Wood, 
2010)。 在 日 常生 活 中 , 社会 互动 无 处 不 在 , 与 朋 
友 聊 天 、 与 舞伴 跳舞 、 与 对 手 格斗 都 属于 不 同形 
式 的 社会 互动 ,人 研究 社会 互动 有 两 种 不 同 的 视角 : 
“第 二 人 称 ” 视 角 (second-person perspective) 和 “第 
三 人 称 ” 视 角 (third-person perspective)。“ 第 二 人 
称 ” 视 角 的 研究 一 般 通 过 创造 实时 的 互动 情境 ， 
考察 被 试 与 他 人 直接 进行 互动 时 的 认 知 过 程 
(Jiang et al., 2012; Schilbach et al., 2013)。 与 之 相 
对 ,“ 第 三 人 称 ” 视 角 的 研究 主要 关注 被 试 作为 旁 
观 者 ,在 观察 他 人 进行 社会 互动 时 的 认 知 过 程 
(Quadflieg & Koldewyn, 2017), 包括 对 互动 双方 
特征 的 知觉 和 意图 的 推断 等 。 观 察 并 理解 他 人 的 
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社会 互动 不 仅 对 于 人 类 的 生存 进化 具有 重要 的 意 
义 , 而 且 在 我 们 的 日 常生 活 中 起 着 重要 的 作用 。 
它 提供 了 个 体 观察 学 习 的 机 会 , 有 助 于 个 体 更 好 
地 了 解 他 人 的 个 性 特征 和 社会 关系 ， 从 而 加 深 对 
社会 群体 的 理解 ， 提 高 社会 交往 的 技能 (Matheson 
et al., 2013; Milinski, 2016)。 

近年 来 ， 越 来 越 多 的 研究 从 “第 三 人 称 ” 视 角 
来 探究 社会 互动 , 这 既 可 以 揭示 人 类 加 工 他 人 互 
动 的 认 知 神经 机 制 ， 同 时 也 为 特殊 人 群 的 诊断 鉴 
定 和 社会 互动 的 场景 识别 提供 了 参考 ， 因 此 具有 
重要 的 理论 意义 和 应 用 价值 。 本 文 从 “第 三 人 称 ” 
视角 出 发 ,论述 了 社会 互动 加 工 的 前 提 条 件 和 认 
知 特性 ， 并 在 梳理 了 社会 互动 加 工 的 认 知 神经 机 
制 的 基础 上 ， 探 讨 了 需要 进一步 研究 的 科学 问 
题 。 因 此 ,下 文 提 到 的 社会 互动 特 指 “ 第 三 人 称 ” 
视角 的 社会 互动 。 


2 ”社会 互动 加 工 的 前 提 条 件 


社会 互动 具有 多 种 多 样 的 呈现 方式 ， 既 包括 
简短 的 视频 (Sinke et al., 2010), 静止 的 图 片 
(Quadflieg et al.，2015)， 也 包括 将 人 物 抽象 成 关 
节点 的 光 点 动画 (Manera et al., 2010) 和 只 具备 生 
物 运 动 模式 的 简单 几何 图 形 (Gao et al., 2012)。 人 
们 仅仅 通过 观察 这 些 社会 互动 的 刺激 ， 就 可 以 判 
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断 出 双方 是 否 在 进行 互动 ， 具体 在 进行 哪 种 互动 
(Manera etal., 2016), 进而 可 以 推断 他 们 是 友好 还 
是 敌对 (Wu et al., 2018), 关系 是 否 亲密 (Costanzo 
& Archer, 1989), 或 者 彼此 的 社会 地 位 是 否 相 同 
等 多 种 社会 信息 (Floyd & Erbert, 2003; Mast & 
Hall, 2004). 

不 管 以 哪 种 方式 呈现 ， 只 有 同时 满足 空间 、 

时 间 及 意义 维度 上 的 前 提 条 件 ， 两 个 个 体 才 会 被 
知觉 为 正在 进行 社会 互动 。 具 体 而 言 ， 在 空间 维 
度 上 ， 两 个 个 体 的 空间 距离 和 身体 朝向 都 会 影响 
观察 者 对 社会 互动 的 感知 。 最 近 的 研究 发 现 两 个 
个 体 的 距离 越 近 ， 身 体 越 是 朝向 对 方 ， 他 们 被 判 
断 为 正在 互动 的 可 能 性 就 越 大 (Hartmann et al., 
2019; Zhou et al., 2019)。 在 时 间 维 度 上 ， 当 两 个 个 
体 的 动作 具有 连续 性 时 ， 即 小 人 A 的 动作 完成 后 
小 人 B 做 出 及 时 的 回应 , 他 们 更 可 能 被 认为 在 进 
行 社会 互动 。 而 随 着 双方 动作 时 间 间 隔 的 增 大 ， 
小 人 A 的 动作 对 小 人 B 的 预测 作用 也 会 相应 变 差 
(Manera et al.，2013)， 这 意味 着 观察 者 对 双方 互 
动 的 知觉 也 随 之 变 差 。 在 意义 维度 上 ， 两 个 个 体 
的 动作 只 有 形成 符合 逻辑 的 联系 , 才 有 可 能 被 认 
为 存在 社会 互动 关系 。 例如 ， 当 小 人 A 发 出 “站 起 
来 ”的 动作 指令 , 小 人 B 从 蹲 下 的 姿态 站 了 起 来 ， 
两 个 小 人 会 被 知觉 为 正在 互动 ; 如 果 A 发 出 同样 
的 指令 , 而 B 从 始 至 终 一 直 在 扫地 ， 他 们 就 会 被 
认为 是 相互 独立 的 个 体 , 彼此 没有 互动 (Manera et 
al., 2015)。 综 上 所 述 , 距离 相近 、 身 体 相 向 、 时 间 
连续 、 意 义 合理 均 为 个 体感 知 到 社会 互动 的 前 提 
条 件 。 绝 大 多 数 研究 者 会 基于 上 述 前 提 条 件 之 一 ， 
生成 背 对 背 的 身体 姿态 , 打 乱 互动 双方 动作 的 时 
间 结 构 , 或 者 匹配 两 个 没有 侵 辑 关联 的 动作 ， 作 
为 控制 实验 的 非 社会 互动 刺激 。 然 而 ,在 真实 的 
社会 情境 中 ， 上 述 因 素 往往 共同 影响 着 个 体 对 社 
会 互动 的 判断 , 但 只 有 极 少 数 研 究 同 时 考察 了 多 
种 因素 在 社会 互动 知觉 中 的 作用 (Hartmann et al., 
2019), 未 来 可 从 整合 的 视角 考察 多 种 因素 的 共 
同 作用 方式 。 


3 ”社会 互动 加 工 的 认 知 特性 
两 个 互动 的 个 体 一 旦 被 第 三 方 知觉 为 正在 进 
行 社会 互动 , 他 们 在 空间 上 就 会 以 整体 构 形 (global 


configuration) 的 方式 得 到 加 工 ， 而 他 们 的 动作 在 
时 间 上 则 以 彼此 关联 且 有 意义 的 方式 得 到 表征 。 


d 


这 种 构 形 的 整体 性 和 动作 的 关联 性 既是 社会 互动 
加 工 的 认 知 特性 ， 也 是 社会 互动 具有 加 工 优势 的 
潜在 原因 (Fedorov et al., 2018; Neri et al., 2006; 
Papeo et al., 2019; Vestner et al., 2019)。 下 文 将 详 
细 阐 述 支 持 这 两 种 认 知 特性 的 证 据 ， 以 及 它们 所 
带 来 加 工 优势 的 具体 表现 。 

3.1 整体 性 构 形 加 工 

社会 互动 的 整体 性 构 形 加 工 是 指 人 们 对 两 个 
互动 的 个 体 所 形成 的 空间 结构 (面对面 的 身体 朝 
向 ) 进 行 整体 表征 ， 即 互动 双方 被 当 作 一 个 结构 化 
的 功能 整体 而 非 两 个 独立 的 个 体 得 到 加 工 和 存储 
(Ding et al., 2017; Papeo et al., 2019; Papeo et al., 
2017; Vestner et al., 2019)。 假 设 社会 互动 存在 整体 
PERT UN, 那么 互动 双方 作为 一 个 整体 必然 会 
影响 空间 注意 的 分 配 (Shen et al., 2016; Yin et al., 
2018)， 表 现 出 经 典 的 客体 注意 效应 (object-based 
attentional effect)， 即 注意 资源 会 自动 分 配 在 同一 
客体 的 不 同 部 分 ， 对 它们 的 反应 要 快 于 对 其 它 客 
体 的 反应 。 在 社会 互动 情境 中 ， 当 线索 呈现 在 一 
个 小 人 身上 时 , 被 试 不 仅 对 同一 小 人 身上 的 目标 
反应 更 快 ， 对 与 他 互动 小 人 身上 的 目标 反应 也 快 
于 其 他 小 人 身上 的 目标 ; 而 此 效应 在 非 互 动 的 情 
景 下 消失 (Ji et al., 2020)。 不 仅 如 此 ,社会 互动 的 
整体 性 构 形 加 工 还 直接 体现 在 由 于 互动 双方 被 知 
觉 为 一 个 整体 ， 他们 的 主观 距离 比 实 际 距 离 更 近 
(Vestner et al., 2019)。 

在 整体 性 构 形 加 工 中 , 互动 双方 的 空间 结构 
以 整体 的 方式 得 到 表征 。 相 比 于 对 局 部 空间 信息 
的 逐步 加 工 ， 这 种 整体 加 工 的 方式 在 一 定 程度 上 
减少 了 认 知 负荷 ， 从 而 使 互动 刺激 比 非 互动 刺激 
具有 加 工 优势 (Papeo et al., 2019; Papeo et al., 
2017; Vestner et al., 2020)。 首先， 整体 性 构 形 加 工 
有 助 于 互动 刺激 快速 通达 意识 ， 被 试 识别 被 掩蔽 
到 阔 下 的 两 个 面对面 互动 小 人 的 正确 率 显 著 高 于 
被 掩蔽 的 背 对 背 非 互动 小 人 ; 而 对 于 倒置 的 刺激 ， 
被 试 则 不 会 表现 出 这 种 识别 优势 (Papeo et al., 
2017)。 其 次 ,整体 性 构 形 加 工 也 有 助 于 快速 搜索 
互动 刺激 ,表现 出 搜索 不 对 称 性 ， 即 从 一 群 背 对 
背 小 人 中 搜索 面对面 小 人 比 从 一 群 面对面 小 人 中 
搜索 背 对 背 小 人 的 正确 率 更 高 ， 速 度 更 快 (Papeo 
et al., 2019)。 最 后 ,整体 性 构 形 加 工 还 有 利于 记忆 
的 存储 和 提取 。 不 论 在 短 时 记忆 任务 还 是 长 时 记 
忆 的 任务 中 ,被 试 记忆 互动 刺激 的 正确 率 都 高 于 
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非 互 动 刺激 (Ding et al., 2017; Vestner et al., 
2019)。 以 上 这 些 研究 不 仅 证 明了 整体 性 构 形 加 工 
所 带 来 的 加 工 优势 ,也 再 次 印证 了 社会 互动 加 工 
中 存在 整体 性 构 形 表征 。 但 是 , 关于 整体 性 构 形 


个 互动 或 非 互动 的 小 人 ,， 另 一 个 动画 则 只 包含 其 
中 的 一 个 小 人 ,结果 发 现 当 双人 动画 是 时 间 结 构 
完整 的 互动 动画 时 , 被 试 判 断 双人 动画 的 正确 率 
更 高 。 随 后 的 研究 则 进一步 证 实 , 被 试 可 以 利用 


加 工 是 特异 于 社会 互动 刺激 还 是 也 存在 于 其 他 面 
对 面 的 客体 中 ， 目 前 还 尚未 得 出 一 致 的 结论 
(Papeo & Abassi, 2019; Vestner et al., 2020)。 假 如 
整体 性 构 形 加 工 特异 于 社会 互动 刺激 ， 是 否 适 用 
于 所 有 类 型 (如 合作 或 竞争 ) 的 社会 互动 也 有 待 进 
一 步 的 研究 (Yin et al., 2013). 
3.2 ”关联 性 动作 表征 

社会 互动 不 仅 在 空间 上 作为 一 个 整体 被 加 工 ， 
同时 也 是 一 个 动态 连续 的 时 间 过 程 。 在 社会 互动 
H, 不 论 是 社交 发 起 者 传递 交流 意图 ， 回应 者 做 
出 回应 (例如 , A 扔 出 东西 , B 接 住 ), 还 是 互动 双方 
通过 默契 的 配合 ， 完 成 协调 性 的 联合 动作 (joint 
action， 如 双人 舞蹈 ; Marsh et al., 2009; Pesquita 
et al，2018)， 双 方 的 动作 都 是 有 联系 的 ， 它 们 共 
同 组 成 了 一 个 有 意义 的 、 连 续 的 时 间 结 构 ， 这 使 
得 互动 动作 以 相互 关联 的 形式 在 大 脑 中 被 表征 。 
有 研究 者 使 用 了 两 对 互动 动作 一 一 “ 拿 来 ”回应 
“给 予 ”,“ 接 住 ” 回 应 “ 扔 出 ”一 一 来 检验 观察 一 个 动 
作 是 否 能 够 自动 触发 与 它 相关 联 的 动作 表征 。 他 
(AO, 给 被 试 重复 呈现 “ 拿 来 ”的 动作 , 会 让 他 
们 更 倾向 于 将 既 像 “ 拿 来 "又 像 “ 接 住 ” 的 两 可 动作 
知觉 成 “ 接 住 ”的 动作 ; 更 为 关键 的 是 ， 即 使 重复 
呈现 “给 予 ” 的 动作 后 ， 被 试 也 会 把 这 个 两 可 动作 
知觉 成 “ 接 住 * 的 动作 。 可见， 尽管 "给予 与 “ 拿 来 ” 
的 动作 存在 很 大 的 视觉 差异 , 却 可 以 引发 相同 的 
适应 结果 。 这 种 交叉 适应 效应 (cross-adaptation 
effects) 充 分 证 明了 互动 动作 存在 关联 性 的 表征 
(Fedorov et al., 2018)。 此 外 ,关联 性 动作 表征 的 证 
据 还 体现 在 被 试 对 互动 动作 的 时 间 感 知 更 短 (Liu 
et al., 2018)， 动 作 流畅 性 更 高 (Peng et al., 2020). 

关联 性 动作 表征 使 得 人 类 对 他 人 互动 行为 的 
感知 不 仅 基 于 当前 的 视觉 输入 ,还 可 以 依赖 先前 
的 知识 经 验 和 动作 之 间 连 续 的 时 间 结 构 ， 预 测 接 
下 来 可 能 的 动作 ， 从 而 在 不 确定 性 较 高 的 情况 下 ， 
更 好 地 识别 互动 动作 (Manera, Becchio et al., 2011; 
Manera, Giudice et al., 2011; Neri et al., 2006; von 
der Luhe et al., 2016). Neri 和 他 的 同事 (2006) 最 早 
证 明了 这 种 促进 效应 。 他 们 给 被 试 先后 呈现 两 个 
被 噪音 点 掩蔽 的 光 点 动画 ， 其 中 一 个 动画 包含 两 


社交 发 起 者 的 动作 来 预测 回应 者 的 动作 ， 具体 表 
现 为 当 两 个 小 人 A 和 B 中 的 回应 者 B 被 噪音 掩蔽 
时 , 若 小 人 A 和 B 具有 互动 关系 ,被 试 从 噪音 中 
辨别 小 人 B 会 更 容易 (Manera, Becchio et al., 2011; 
Manera, Giudice et al., 2011; Manera et al., 2013). 

除了 噪音 掩蔽 范式 ， 这 种 基于 关联 性 动作 的 预测 
效应 在 双眼 竞争 (binocular rivalry) 范 式 中 也 得 到 
了 验证 (Su et al., 2016)。 尽管 选取 了 不 同 的 实验 范 
式 和 和 多样 的 刺激 形式 ， 上 述 研究 都 得 出 了 较为 一 
致 的 结论 : 关联 性 动作 表征 可 以 促进 互动 动作 的 
识别 。 不 过 目前 的 研究 主要 以 整个 身体 的 动作 为 
FE, 较 少 关注 手势 、 双 上 脚 等 局 部 股 体 动作 (Zaini 
etal., 2013); 而 在 跳舞 等 某 些 特定 情景 中 ， 局 部 
肢体 动作 也 是 重要 的 信息 传递 载体 ， 未 来 的 研究 
可 以 应 用 更 具 生 态 效 度 的 刺激 来 探索 局 部 肢体 动 
作 的 关联 性 表征 在 社会 互动 中 的 作用 


4 ”社会 互动 加 工 的 脑 机 制 


作为 高 级 认 知 活动 ,社会 互动 加 工 是 一 个 从 
识别 双方 身体 和 面孔 到 理解 互动 的 动作 ， 从 而 推 
测 其 交流 意图 的 层级 加 工 过 程 。 这 个 过 程 可 以 简 
单 分 为 三 个 阶段 ， 分 别 对 应 于 三 个 脑 网 络 ( 见 图 
1): 个 体感 知 网 络 (person perception network), Z} 
作 观 察 网 络 (action observation network) 和 心智 化 
网 络 (mentalizing network), 详 见 Quadflieg 和 
Koldewyn (2017) 的 综述 。 个 体感 知 网 络 负 责 对 互 
动 者 的 身体 和 面孔 进行 视觉 分 析 ， 主 要 包括 特异 
于 面孔 加 工 的 梭 状 回 (fusiform face area, FFA), 、 肢 
体 加 工 的 外 纹 状 皮层 身体 区 (extrastriate body area, 
EBA), SA WL AA Wie HM Je eb A 
(posterior superior temporal sulcus, pSTS; Quadflieg 
et al., 2015)。 动 作 观 察 网 络 属于 镜像 神经 元 系统 
(mirror neuron system, MNS), 主要 参与 对 他 人 动 
作 的 快速 识别 及 意图 的 准确 理解 ， 由 前 运动 皮层 
(premotor cortex, PMC)、 额 下 回 (inferior frontal 
gyri, IFG) 和 顶 下 小 叶 (inferior parietal lobule, IPL) 
等 组 成 (Caspers et al., 2010)。 心 智 化 网 络 是 心理 理 
论 (theory of mind) 的 神经 基础 ， 主 要 负责 判断 他 
人 抽象 的 心理 状态 (如 欲望、 动机 、 意 图、 观念 等 ) 
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个 体感 知 网 络 
感知 面孔 和 肢体 


动作 观察 网 络 心智 化 网 络 
理解 动作 和 识别 意图 


推断 心理 状态 


梭 状 回 (FFA) = 前 运动 皮层 (PMC) 背 / 腹 内 侧 前 额 叶 皮层 
Jax EW (pSTS) 额 下 回 (IFG) (dmPFC/vmPFC) 
外 纹 状 皮层 身体 区 (EBA) 顶 下 小 叶 (IPL) PKA KTP) 
模 前 叶 (PrC) 


和 推测 复杂 的 社会 属性 (如 社会 规范 ， 亲 属 关 系 ， 
情绪 状态 等 ; Keysers & Gazzola, 2007), 它 主要 包 
括 背 / 腹 内 侧 前 额 叶 皮 层 (dorsal/ventral medial 
prefrontal cortex, dmPFC/vmPFC), #i TERA K 
(temporoparietal junction, TPJ), #2 Hil! (precuneus, 
PrC) 等 脑 区 (Schurz et al., 2014). 
4.1 与 社会 互动 认 知 特性 相关 的 脑 区 

在 揭示 社会 互动 加 工 的 脑 网 络 时 ， 研 究 者 主 
要 关注 被 试 观看 互动 刺激 所 激活 的 脑 区 , 但 随 着 
行为 范式 和 数据 处 理 方法 的 发 展 , 更 多 的 研究 者 
也 开始 寻找 与 社会 互动 认 知 特性 加 工 相 关 的 脑 
区 。 首 先 ， 是 否 存在 特定 的 脑 区 支持 社会 互动 的 
整体 构 形 加 工 ? 已 有 证 据 提 示 , 属于 个 体感 知 网 
络 的 EBA 脑 区 ， 对 身体 的 姿态 信息 敏感 ， 并 基于 
此 对 动作 进行 编码 (Downing et al., 2006)， 因 此 可 
能 是 与 社会 互动 整体 构 形 加 工 相关 的 脑 区 。 为 了 
证 明 这 个 推断 ， 研 究 者 利用 多 体 素 模式 分 析 技 术 
(multivoxel pattern analysis，MVPA)， 训 练 分 类 器 
根据 pSTS 或 EBA 的 激活 模式 来 判断 被 试 观看 互 
动 视频 的 类 型 (争论 、 庆祝 或 大 笑 )， 然 后 分 别 测试 
辨别 两 人 互动 动作 以 及 其 中 单 人 动作 的 成 绩 。 测 
试 结果 表明 , pSTS 能 够 分 辨 互动 动作 和 单 人 动作 ， 
但 是 两 者 的 正确 率 没有 显著 差异 ; 而 EBA 区 分 互 
动 动作 的 正确 率 要 显著 高 于 区 分 单 人 动作 的 正确 
率 , 这 说 明 EBA 除了 加 工 局 部 单 人 动作 ,也 提取 
了 社会 互动 独特 的 整体 信息 (Walbrin & Koldewyn, 
2019)。 随 后 的 研究 进一步 表明 EBA 的 整体 编码 


图 1 社会 互动 加 工 过 程 的 脑 网 络 。 各 个 脑 区 分 别 对 应 着 下 方 相同 颜色 的 脑 网 络 。 


只 限于 面对面 的 小 人 , 也 就 是 说 ,在 训练 分 类 器 
对 单个 小 人 的 动作 进行 区 分 后 ， 当 这 个 小 人 与 另 

一 个 小 人 面对面 而 非 背 对 背 时 ,通过 EBA 的 激活 

模式 识别 出 此 小 人 动作 的 正确 率 更 高 。 即 当 两 个 
小 人 的 身体 相向 从 而 形成 社会 互动 关系 时 ,EBA 
编码 单个 小 人 身体 的 能 力也 得 到 增强 (Abassi & 
Papeo，2020)。 上 述 结果 都 证 明了 EBA 在 社会 互 

动 的 整体 性 构 形 加 工 中 发 挥 了 重要 的 作用 (Abassi 
& Papeo, 2020; Walbrin & Koldewyn, 2019)。 

社会 互动 的 关联 性 动作 。 由 于 关联 性 动作 表征 依 
赖 先后 动作 在 时 间 上 的 连续 和 意义 上 的 联系 ， 

此 可 能 与 动作 观察 网 络 和 心智 化 网 络 有 关 。 在 社 
会 互动 中 , 关联 性 动作 相 比 于 非 关 联 性 动作 (用 一 
个 小 人 的 镜像 动作 替代 与 他 互动 的 另 一 人 的 动作 ) 
更 强 的 激活 了 包括 IFG (延伸 到 PMC), pSTS 和 左 

侧 IPL 等 在 内 的 动作 观察 网 络 (Georgescu et al., 
2014)。 此 外 , Zillekens 等 人 (2019) 利 用 前 人 开发 的 

噪音 掩蔽 范式 (Manera, Giudice et al., 2011) 初 步 考 

察 了 社会 互动 中 预测 他 人 动作 的 神经 机 制 。 他 们 

通过 操纵 小 人 A 是 否 向 小 人 B 传递 交流 的 意图 ， 

将 动画 分 为 互动 与 非 互 动 动画 ; 同时 将 小 人 B 用 

噪音 掩蔽 ， 要求 被 试 判 断 小 人 B 是 否 存 在 。 结 果 

EM, 无 论 小 人 B 是 否 存在 , 互动 动画 比 非 互 动 

动画 都 显著 的 增强 了 额 上 回 (superior frontal gyrus, 
SFG)， 相 反 则 激活 了 顶 上 小 叶 (superior parietal 
lobule, SPL), #% F El(inferior temporal gyri, ITG) 
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等 属于 动作 观察 网 络 的 脑 区 ; 上 述 结果 表明 ,在 
互动 情景 下 大 脑 能 够 根据 小 人 A 的 动作 形成 对 小 
人 B 动作 的 预期 , 这 一 定 程度 上 减少 了 执行 控制 
的 需求 进而 表现 出 动作 观察 网 络 激活 水 平 的 降 
低 。 当 违反 预期 时 ， 即 在 互动 动画 中 B 不 存在 或 
在 非 互 动 动画 中 B 存在 时 , 右 侧 后 内 侧 额 回 (right 
posterior medial frontal gyrus, TPMFG) 、 双 侧 枫 前 
叶 、 左 侧 小 脑 和 左 侧 梭 状 回 都 被 更 强 激 活 ， 这 些 
脑 区 可 能 与 社会 互动 中 预测 偏差 有 关 。 此 外 , 研 
究 还 发 现 杏仁 核 的 激活 程度 可 以 预测 被 试 辨 别 B 
的 能 力 ， 并 且 在 互动 情境 条 件 下 杏仁 核 与 mPFC 
的 功能 连接 也 得 到 增强 ， 这 反映 了 对 互动 动作 的 
预期 涉及 较 复 杂 的 社会 推断 ， 可 能 需要 整合 心智 
化 网 络 的 功能 (Zillekens et al., 2019)。 

上 述 研究 发 现 了 表征 社会 互动 认 知 特性 所 对 
应 的 脑 区 ， 为 揭示 整体 性 构 形 加 工 与 关联 性 动作 
表征 的 神经 机 制 提供 了 初步 的 方向 。 但 许多 重要 
的 问题 还 有 等 探索 ,如 依据 互动 发 起 者 的 动作 激 
活 模式 是 否 可 以 解码 出 回应 者 的 动作 。 另 外 ,和 研 
究 还 吸 需 建立 行为 任务 表现 与 脑 成 像 结 果 的 联系 
从 而 更 准确 地 揭示 行为 与 脑 功能 的 关系 ,， 如 EBA 
的 激活 是 否 可 以 预测 整体 性 构 形 加 工 任务 的 成 绩 
且 反 映 社会 互动 知觉 的 个 体 差异 。 

4.2 ”社会 互动 加 工 的 特异 性 脑 区 

尽管 社会 互动 加 工 在 不 同 的 阶段 激活 了 众多 
不 同 的 脑 区 , 但 有 些 脑 区 可 能 仅仅 参与 了 单个 人 
的 身体 感知 和 动作 理解 ,， 因此 , 人 研究 者 试图 通过 
更 精细 的 实验 设计 分 离 出 真正 能 表征 互动 关系 的 
特异 性 脑 区 。 在 一 个 以 猕猴 为 被 试 的 实验 中 , 研 
究 者 利用 功能 磁 共 振 成 像 技 术 (functional magnetic 
resonance imaging, fMRI) 考 察 猕猴 在 观看 不 同 互 
动 视频 时 全 脑 的 激活 情况 (Sliwa & Freiwald, 
2017), 结果 发 现 只 有 内 侧 前 额 叶 以 及 IPL 的 部 分 
脑 区 (对 应 于 人 类 的 心智 化 网 络 ) 特 异 于 加 工 猴 子 
与 猴子 之 间 的 社会 互动 ， 而 对 猴子 与 物体 互动 、 
物体 与 物体 互动 的 视频 都 不 敏感 。 这 说 明 猕 猴 大 
脑 中 存在 表征 社会 互动 关系 的 特异 性 脑 区 。 但 是 ， 
人 类 大 脑 中 是 否 也 存在 类 似 的 脑 区 ? 研究 者 把 目 
JERE LT pSTS， 它 不 仅 被 认为 是 个 体感 知 网 络 
的 脑 区 ， 也 经 常 被 看 作 动作 观察 网 络 和 心智 化 网 
络 的 脑 区 (Deen et al., 2015; Yang et al., 2015), 并 
且 它 对 多 种 类 型 的 社会 刺激 都 有 反应 ， 被 称 为 社 
会 大 脑 的 “中 枢 ”(Lahnakoski et al., 2012)。 为 了 进 


一 步 排 除 无 关 变量 对 结果 的 影响 , Isik 等 人 (2017) 
简化 了 社会 互动 刺激 的 物理 属性 ， 只 保留 了 它们 
的 互动 关系 。 他 们 发 现 ， 由 简单 几何 图 形 所 组 成 
的 互动 动画 (两 个 图 形 相 互 阻碍 或 者 相互 帮助 ) 比 
物理 互动 (两 个 图 形 相 撞 ) 或 单 人 动画 更 强 显著 激 
活 了 pSTS, 而 且 研 究 者 利用 MVPA 技术 ,通过 
pSTS 的 激活 模式 可 以 区 分 出 互动 关系 是 阻碍 还 
是 帮助 。 该 实验 表明 pSTS 能 够 表征 社会 互动 关 
系 (类 似 结果 见 Walbrin et al., 2018), 可 能 是 加 工 
社会 互动 的 特异 性 脑 区 (Isik et al., 2017)。 但 值得 
注意 的 是 ,在 该 研究 中 pSTS 只 是 对 社会 互动 反 
应 最 强 的 一 个 区 域 ， 它 的 边界 也 延伸 到 了 附近 表 
征 心理 理论 的 TPJ 区 域 和 功能 定位 的 动态 面孔 脑 
区 。 综 上 , 大 脑 中 可 能 存在 真正 表征 社会 互动 关 
系 的 特异 性 脑 区 一 一 心智 化 网 络 及 附近 的 pSTS 
(Isik et al., 2017)， 这 些 脑 区 对 应 于 理解 双方 意图 
及 心理 状态 的 加 工 阶段 。 

4.3 ”社会 互动 加 工 脑 区 的 功能 连接 

近年 来 ,一些 研究 者 从 层级 加 工 的 角度 出 发 
进一步 探讨 不 同 脑 区 在 整个 加 工 过 程 中 的 信息 传 
递 和 功能 连接 。 一 项 脑 成 像 元 分 析 的 研究 指出 ， 
在 社会 互动 加 工 中 ， 从 识别 个 体 的 动作 到 解析 单 
个 动作 和 互动 动作 的 意 网 ， 再 到 推断 动作 意图 背 
后 的 心理 状态 ， 主 要 激活 了 从 普 叶 中 后 部 皮层 经 
pSTS 传 向 TPJ 的 通路 (Arioli & Canessa, 2019)。 
有 研究 者 推断 STS 很 可 能 是 社会 互动 加 工 过 程 中 
的 重要 节点 ,起 着 对 信息 进行 分 类 盘 选 并 向 其 它 
脑 区 传输 的 作用 (Sliwa & Freiwald, 2017)， 因 此 它 
与 其 它 脑 区 的 功能 连接 也 可 能 会 受到 社会 互动 类 
型 的 调节 。 在 需要 理解 动作 的 共同 意图 时 ， 比 如 
两 个 人 合作 搬 箱子 , pSTS 与 动作 观察 网 络 中 的 顶 
上 小 叶 (superior parietal lobule, SPO FIR M] PMC 
的 连接 得 到 增强 ; 而 在 需要 理解 情绪 的 互动 中 ， 
比如 两 个 人 微笑 着 牵手 pSTS 与 心智 化 网 络 中 
vmPFC 的 连接 更 强 (Arioli et al., 2018)。 目 前 有 关 
功能 连接 的 研究 只 是 刚刚 起 步 ， 未 来 需要 更 多 的 
数据 来 全 面 刻画 不 同 阶 段 和 不 同类 型 的 社会 互动 
加 工 所 依赖 的 功能 连接 模式 ， 并 揭示 关键 节点 如 
pSTS 在 社会 互动 信息 传递 中 的 作用 


5 总 结 与 展望 


在 社会 环境 中 , 他 人 的 社会 互动 为 我 们 提供 
了 丰富 的 社会 信息 ， 所 以 检测 和 识别 社会 互动 信 
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息 是 十 分 重要 的 。 这 种 重要 性 使 得 社会 互动 同 面 
孔 和 生物 运动 一 样 ， 人 类 对 其 具有 较 高 的 敏感 性 ， 
表现 出 对 社会 互动 的 加 工 优势 : 相 比 于 非 社会 
互动 刺激 ， 会 优先 加 工 社会 互动 刺激 ; 识别 与 记 
忆 社 会 互动 刺激 的 能 力也 更 强 。 人 类 对 社会 互动 
整体 性 构 性 加 工 和 关联 性 动作 表征 是 构成 其 加 
工 优势 的 深层 原因 。 社 会 互动 是 一 个 层级 加 工 过 
程 ,所 涉及 的 脑 网 络 包括 个 体感 知 网 络 、 动 作 观 
察 网 络 和 心智 化 网 络 (Quadflieg & Koldewyn, 
2017)。 对 于 社会 互动 加 工 的 认 知 特性 来 说 ， 初 步 
的 研究 显示 EBA 参与 社会 互动 的 整体 性 构 形 加 
工 ， 而 动作 观察 网 络 和 心智 化 网 络 的 一 些 脑 区 
则 与 关联 性 动作 表征 有 关 。 尽管 存在 某 些 特定 的 
脑 区 对 社会 互动 关系 更 为 敏感 , 但 是 各 个 脑 区 
在 不 同 加 工 阶段 的 信息 传递 和 相应 的 功能 连接 
对 于 完成 社会 互动 加 工 也 同样 重要 (Arioli & 
Canessa, 2019)。 总结 来 看 ， 尽 管 研 究 者 对 社会 互 
动 加 工 进行 了 多 方面 的 探索 , 但 还 有 一 些 需要 
解决 的 问题 。 

第 一 ， 人 类 能 够 快速 探测 到 社会 互动 信号 ， 
正确 解读 他 人 的 动作 含义 , 但 这 种 能 力 是 否 来 自 
先天 遗传 还 未 有 定论 。 研 究 显示 ，5~14 个 月 的 婴 
儿 更 加 偏好 社会 互动 的 信息 ， 当 屏幕 两 侧 同时 呈 
现 互动 和 非 互动 的 动画 时 ， 他 们 对 互动 动画 的 注 
视 时 间 更 长 (Galazka et al.，2014)， 而 且 在 两 个 个 
体 动态 追逐 的 动画 中 ,他 们 的 目光 注视 “ 追 ” 的 个 
体 时间 显 著 长 于 “ 逃 ?的 个 体 和 不 参与 互动 的 个 体 
(Galazka & Nyström, 2016)。 这 说 明 不 到 1 岁 的 婴 
儿 已 经 对 环境 中 的 互动 信息 及 发 起 互动 的 个 体 表 
现 出 更 多 兴趣 ,表明 这 种 能 力 可 能 是 人 类 在 进化 
过 程 中 通过 自然 选择 而 保留 下 来 的 ， 因 此 具有 
定 的 遗传 性 。 未 来 可 通过 行为 遗传 学 的 方法 ， 比 
如 双生 子 实验 (Wang et al.，2018)， 对 社会 互动 的 
遗传 特性 提供 更 为 直接 的 证 据 。 

第 二 ， 以 往 的 很 多 研究 都 指出 ， 人 类 对 诸如 
面孔 、 生 物 运 动 等 传递 出 大 量 生物 性 和 社会 性 信 
息 的 刺激 都 具有 整体 加 工 优势 ， 即 加 工 依赖 于 各 
个 部 分 之 间 的 空间 结构 关系 并 表现 出 经 典 的 倒置 
效应 (Farah et al., 1995; Reed et al., 2003)。 相 比 于 
精细 的 轮廓 线 等 具有 较 高 空间 频率 的 信息 ， 较 为 
粗略 的 整体 结构 体现 在 刺激 低空 间 频率 信息 中 ， 
且 加 工 速度 快 于 高 频 信息 ， 因 此 这 种 整体 加 工 优 
势 通 常 被 认为 只 存在 于 刺激 的 低频 信息 (Goffaux 


Et 


et al., 2011)。 与 面孔 和 生物 运动 类 似 ， 社 会 互动 也 
以 整体 构 形 的 方式 被 加 工 ， 并且 传递 出 重要 的 社 
会 性 信息 ， 具 有 进化 意义 。 所 以 社会 互动 的 整体 
构 形 可 能 特异 于 互动 刺激 的 低频 成 分 从 而 表现 
出 相对 于 非 互动 刺激 的 加 工 优势 。 但 是 ， 上 述 推 
断 是 否 正确 还 需要 进一步 的 实验 进行 探究 。 

第 三 ， 相 关 脑 机 制 的 研究 已 经 表明 社会 互动 
加 工 是 一 个 层级 加 工 过 程 。 尽 管 现 有 的 研究 揭示 
了 动作 观察 网 络 、 心 智 化 网 络 和 pSTS 在 社会 互 
动 加 工 中 的 作用 (Arioli & Canessa, 2019; Sliwa & 
Freiwald，2017), 但 无 论 是 从 社会 互动 认 知 特性 
的 脑 机 制 ， 特 异性 脑 区 ,还 是 脑 区 之 间 功 能 连接 
的 角度 ， 仍 有 许多 问题 值得 探索 。 比 如 ,在 预测 他 
人 动作 时 ， 相 应 脑 区 的 功能 连接 是 否 随 互 动 的 进 
程 而 动态 变化 ; pSTS 是 否 真 的 具有 筛选 和 传递 社 
会 互动 信息 的 功能 ; 不 同类 型 社会 互动 的 脑 机 制 
有 多 大 的 异同 (Canessa et al., 2012; Sinke et al., 
2010), 是 否 依赖 于 不 同 的 功能 连接 模式 (Arioli et 
al., 2018) 等 等 。 最 后 , 虽然 本 文 主要 关注 “第 三 人 
称 ” 社 会 互动 的 加 工 , 但 随 着 多 人 脑 神经 活动 同 
步 记 录 技 术 (hyperscanning) 的 发 展 ， 人 与 人 之 间 
实时 互动 的 脑 机 制 正 逐 渐 成 为 “第 二 人 称 ” 社 会 互 
动人 研究 的 重点 (Kingsbury & Hong, 2020)。 然 而 ， 目 
前 直接 对 比 两 种 视角 下 社会 互动 加 工 的 研究 还 较 
少 , 未 来 可 结合 多 种 技术 手段 来 探索 它们 在 脑 机 
制 上 的 异同 。 

最 后 ， 目 前 的 研究 多 集中 于 对 社会 互动 的 认 
知 及 神经 机 制 的 探讨 ， 未 来 可 以 多 发 掘 社会 互动 
加 工 的 应 用 价值 。 已 有 多 项 证 据 表 明 某 些 疾病 患 
者 的 社会 互动 加 工 能 力 会 受到 损害 (Centelles et 
al., 2013; Kuschefski et al., 2019; Okruszek et al., 
2015; Walter et al., 2009), 例如 ,高 功能 自 闭 症 患 
者 无 法 利用 互动 动作 之 间 的 关联 性 预测 他 人 的 动 
作 (von der Luhe et al., 2016), 而 精神 分 裂 症 患者 
虽然 表征 关联 性 动作 的 能 力 没有 受到 损伤 ,但 却 
表现 出 对 社会 互动 中 生物 运动 识别 能 力 的 下 降 
(Okruszek et al., 2018, 2019)。 未 来 可 利用 更 具 
生态 效 度 的 虚拟 现实 技术 来 探索 这 些 疾病 患 
加 工 社会 互动 的 认 知 特性 ， 并 为 相关 疾病 的 诊 
断 及 干预 提供 新 的 思路 。 此 外 ,利用 人 工 智 能 识 
别 现实 场景 中 人 与 人 的 互动 行为 , 例如 在 公共 
场所 对 可 疑 群体 的 检测 ， 也 具有 重要 、 广 阔 的 应 
用 前 景 。 
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Abstract: The ability to recognize and decipher social interaction of others from a third-person perspective 


is critical for our daily life. There are two cognitive characteristics accounting for the processing of social 


interaction: configural integrity and action contingency. A hierarchical neural basis underpins social 


interaction processing in which the person perception network, the action observation network and the 


mentalizing network are concurrently engaged, wherein the posterior superior temporal sulcus plays a 


crucial role. Future research needs to explore the heredity of social interaction, to elucidate its underlying 


cognitive and neural mechanism by combining various technological methods, and to focus on its 


application in real life. 
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